我们介绍了Encoder-Forecaster卷积的长短短期记忆(LSTM)深度学习模型,为微软天气的运营降水Newcasting产品提供动力。该模型作为输入一系列天气雷达马赛克,并确定在最多6小时内的铅倍时确定未来雷达反射率。通过沿着特征维度堆叠大型输入接收领域,并通过从基于物理的高分辨率快速刷新(HRRR)模型的预测,通过预测来调节模型的预测,我们能够在多个度量标准上以20-25%的光流和HRRR基线优于光流量和HRRR基线平均在所有交货时间上。
translated by 谷歌翻译
Wind power forecasting helps with the planning for the power systems by contributing to having a higher level of certainty in decision-making. Due to the randomness inherent to meteorological events (e.g., wind speeds), making highly accurate long-term predictions for wind power can be extremely difficult. One approach to remedy this challenge is to utilize weather information from multiple points across a geographical grid to obtain a holistic view of the wind patterns, along with temporal information from the previous power outputs of the wind farms. Our proposed CNN-RNN architecture combines convolutional neural networks (CNNs) and recurrent neural networks (RNNs) to extract spatial and temporal information from multi-dimensional input data to make day-ahead predictions. In this regard, our method incorporates an ultra-wide learning view, combining data from multiple numerical weather prediction models, wind farms, and geographical locations. Additionally, we experiment with global forecasting approaches to understand the impact of training the same model over the datasets obtained from multiple different wind farms, and we employ a method where spatial information extracted from convolutional layers is passed to a tree ensemble (e.g., Light Gradient Boosting Machine (LGBM)) instead of fully connected layers. The results show that our proposed CNN-RNN architecture outperforms other models such as LGBM, Extra Tree regressor and linear regression when trained globally, but fails to replicate such performance when trained individually on each farm. We also observe that passing the spatial information from CNN to LGBM improves its performance, providing further evidence of CNN's spatial feature extraction capabilities.
translated by 谷歌翻译
在联合学习(FL)中,一组参与者共享与将更新结合到全局模型中的聚合服务器在本地数据上计算的更新。但是,将准确性与隐私和安全性进行调和是FL的挑战。一方面,诚实参与者发送的良好更新可能会揭示其私人本地信息,而恶意参与者发送的中毒更新可能会损害模型的可用性和/或完整性。另一方面,通过更新失真赔偿准确性增强隐私,而通过更新聚合损坏安全性,因为它不允许服务器过滤掉单个中毒更新。为了解决准确性私人关系冲突,我们提出{\ em碎片的联合学习}(FFL),其中参与者在将其发送到服务器之前,随机交换并混合其更新的片段。为了获得隐私,我们设计了一个轻巧的协议,该协议允许参与者私下交换和混合其更新的加密片段,以便服务器既不能获得单个更新,也不能将其链接到其发起人。为了实现安全性,我们设计了针对FFL量身定制的基于声誉的防御,该防御根据他们交换的片段质量以及他们发送的混合更新来建立对参与者及其混合更新的信任。由于交换的片段的参数可以保持其原始坐标和攻击者可以中和,因此服务器可以从接收到的混合更新中正确重建全局模型而不会准确损失。四个真实数据集的实验表明,FFL可以防止半冬季服务器安装隐私攻击,可以有效地抵抗中毒攻击,并可以保持全局模型的准确性。
translated by 谷歌翻译
联合学习(FL)通过设计为参与同行提供了自主性和隐私,他们合作地建立了机器学习(ML)模型,同时将其私人数据保存在设备中。但是,同样的自主权通过进行不靶向或有针对性的中毒攻击来使恶意同伴毒害该模型的大门打开了大门。标签弹性(LF)攻击是一种有针对性的中毒攻击,攻击者通过将一些示例的标签从一个类(即源类)转换为另一个类别(即目标类别)来毒害他们的训练数据。不幸的是,这种攻击易于执行,难以检测,并且对全球模型的性能产生负面影响。现有针对LF的防御措施受到对同龄人数据分布和/或使用高维模型的表现不佳的假设的限制。在本文中,我们深入研究了LF攻击行为,并发现攻击者和诚实的同伴在源类示例上的矛盾目标反映在与输出层中源和目标类的相对应的参数梯度中梯度良好的攻击检测特征。因此,我们提出了一种新颖的防御,首先将这些梯度从同龄人的本地更新中动态提取,然后将提取的梯度簇,分析产生的簇,并在模型聚合之前过滤潜在的不良更新。对三个数据集的广泛经验分析显示,无论数据分布或模型维度如何,建议的防御力对LF攻击的有效性。此外,拟议的防御能力通过提供较低的测试错误,更高的总体准确性,更高的源类准确性,较低的攻击成功率和较高的源类准确性稳定性来优于几个最先进的防御能力。
translated by 谷歌翻译
联合学习(FL)使从分发在一组参与工人之间的本地数据中学习全球机器学习模型。这使得i)由于从丰富的联合培训数据中学习而培训更准确的模型,ii)通过不与他人共享工人的本地私人数据来改善隐私。但是,FL的分布性质使其容易受到针对性的中毒攻击的影响,这些攻击会对学习模型的完整性产生负面影响,而不幸的是,很难检测到。现有针对这些攻击的防御措施受到工人数据分布的假设的限制,可能会在主要任务上降低全球模型性能和/或不适合高维模型。在本文中,我们分析了针对FL的靶向攻击,并发现与攻击相关的深度学习模型的最后一层神经元与无关神经元的行为不同,这使得最后一层梯度有价值特征用于攻击检测。因此,我们将\ textit {fl-defender}作为对抗fl目标攻击的方法。它包括i)通过计算工人的最后一层梯度的工人角度相似性来工程更强的判别特征,ii)使用PCA压缩所得的相似性向量,以减少冗余信息,iiii)重新加权工人的''根据它们与压缩相似性向量的质心的偏差。对具有不同DL模型大小和数据分布的三个数据集进行的实验显示了我们方法在防御标签和后门攻击方面的有效性。与几个最先进的防御能力相比,FL Defender取得了最低的攻击成功率,维持全局模型在主要任务上的性能,并导致服务器上的最小计算开销。
translated by 谷歌翻译
越来越密集的流量在我们当地的环境中成为挑战,促使需要更好的交通监控和管理系统。与车辆粗加分类相比,细粒度的车辆分类似乎是一个具有挑战性的任务。因此,基本上需要探索车辆检测和分类的鲁棒方法,因此需要进行细粒度。现有的车辆制作和模型识别(VMMR)系统已经开发在同步和受控的流量条件上。需要在复杂,城市,异构和非同步交通条件下坚固的VMMR仍然是开放式研究区域。在本文中,使用深度学习解决了车辆检测和细粒度分类。为了进行相关复杂性进行细粒度分类,专门制备具有高内部和低次间变异的本地数据集THS-10。 DataSet由4250辆汽车型号的10辆车型号,即本田市,本田思域,铃木,铃木博拉,铃木文化,铃木Mehran,Suzuki Ravi,Suzuki Swift,Suzuki Wagon R和Toyota Corolla。此数据集可在线获取。已经探索了两种方法,并分析了从深神经网络的微调和特征提取的车辆分类。进行比较研究,并证明了更简单的方法可以在当地环境中产生良好的结果,以应对复杂的问题,如密集的遮挡和车道偏离。因此,减少了计算负荷和时间,例如,微调成立-V3产生的最高精度为97.4%,最低错误分类率为2.08%。微调MobileNet-V2和Reset-18分别产生96.8%和95.7%的精度。从FC6亚历尼特层的提取特征产生93.5%的精度,错误分类率为6.5%。
translated by 谷歌翻译
通过为患者启用远程医疗服务,远程医疗有助于促进医疗专业人员的机会。随着必要的技术基础设施的出现,这些服务已逐渐流行。自从Covid-19危机开始以来,远程医疗的好处就变得更加明显,因为人们在大流行期间倾向于亲自探望医生。在本文中,我们专注于促进医生和患者之间的聊天课程。我们注意到,随着对远程医疗服务的需求的增加,聊天体验的质量和效率可能至关重要。因此,我们为医学对话开发了一种智能的自动反应生成机制,该机制可帮助医生有效地对咨询请求做出反应,尤其是在繁忙的课程中。我们探索了9个月内收集的医生和患者之间的900,000多个匿名的历史在线信息。我们实施聚类算法,以确定医生最常见的响应,并相应地手动标记数据。然后,我们使用此预处理数据来训练机器学习算法以生成响应。所考虑的算法有两个步骤:过滤(即触发)模型,以滤除不可行的患者消息和一个响应发生器,以建议成功通过触发阶段的响应前3位医生响应。该方法为Precision@3提供了83.28 \%的精度,并显示出其参数的鲁棒性。
translated by 谷歌翻译